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摘要 : 宇宙 再 电离 时 期 (epoch of reionization, EoR) 的 探测 是 SKA 的 重要 科学 目标 之 一 ， 
也 是 目前 许多 SKA 探 路 者 阵列 的 首要 科学 目标 。 由 于 宇宙 再 电离 信号 非常 微弱 ， 因 此 在 数 
据 处 理 的 过 程 中 存在 许多 难点 ， 如 高 精度 校准 、 大 视 场 高 动态 成 像 等 。 对 默 奇 森 宽 场 阵列 
(Murchison Widefield Array, MWA)、 低 频 阵列 (Low Frequency Array, LOFAR)、21CMA 阵 
列 (21 Centimeter Array, 21CMA) 等 SKA 低频 先导 干涉 阵列 的 基本 数据 处 理 方法 进行 了 综述 ， 
如 干扰 的 识别 与 去 除 、 数 据 校 准 、 可 视 度 研究 以 及 成 像 研究 等 ， 并 对 数据 处 理 时 用 到 的 一 些 常 ) 
技术 与 软件 作 了 相应 的 介绍 与 总 结 。 
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1 引 8 


基于 射电 干涉 综合 孔径 技术 ， 目 前 已 建成 若干 射电 干涉 阵列 ， 如 21CMA 阵列 (21 
Centimeter Array, 21CMAD )、 默 奇 森 宽 场 阵列 (Murchison Widefield Array, MWA”), 
低频 阵列 (Low Frequency Array, LOFAR" )、 巨 米 波 射电 望远镜 (Giant Meterwave Ra- 
dio Telescope, GMRITS )、 澳 大 利 亚 SKA 探 路 者 阵列 (Australian Square Kilometre Array 
Pathfinder, ASKAP"") 等 。 正 在 建设 中 的 平方 公里 阵列 望远镜 (Square Kilometre Array, 
SKA) 是 多 国 参与 建设 的 射电 望远镜 阵列 ， 其 覆盖 面积 将 达到 一 平方 公里 ， 孕 育 着 宏伟 的 科 
学 目标 ， 如 宇宙 黎明 和 再 电离 时 期 探测 “、 脉 冲 星 搜寻 “、 暂 现 源 研究 ”、 字 宙 磁 场 ”、 星 
系 形成 ”等 。 
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射电 干涉 阵列 由 许多 单 天 线 组 成 ， 其 数据 处 理 方法 与 单口 径 射 电 望 远 镜 不 同 。 在 基于 射 
电 干涉 阵列 的 数据 处 理 中 ， 数 据 校准 、 大 视 场 高 动态 成 像 等 方面 都 还 存在 着 困难 与 挑战 。 尤 
其 随 着 大 规模 射电 望远镜 阵列 的 建成 ， 海 量 的 数据 处 理 也 会 造成 硬件 和 软件 上 的 压力 。 解 决 
这 些 困 难 ， 完 善 数据 处 理 中 的 各 个 环节 是 目前 的 重要 工作 ， 也 是 实现 科学 目标 的 根本 保证 。 

探测 宇宙 再 电离 时 期 是 未 来 SKA 低频 阵列 的 首要 科学 目标 之 一 ， 其 观测 的 HI 21 cm 
信号 主要 集中 在 50 ~ 200 MHz 这 一 低频 范围 。 由 于 科技 发 展 和 人 类 活动 ， 在 几 十 到 几 百 
MHz 的 低频 波段 ， 充 斥 着 无 可 避免 的 射电 干扰 (radio frequency interference, RFI^ )， 在 数 
据 处 理 的 过 程 中 进行 干扰 的 识别 与 去 除 无 法 避免 。 除 此 之 外 ， 前 景 射电 源 在 低频 波段 辐射 较 
- 而 望远镜 的 分 状 率 随 观 测 频率 的 降低 而 降低 ， 因 此 如 何在 低频 射电 波段 建立 较为 准确 的 

空 模型 ， 改 善 校 准 结果 ， 以 及 如 何 扣除 低频 波段 具有 较 强 辐射 的 前 景 、 微 弱 再 电离 信号 的 
ee 高 动态 范围 的 大 视 场 成 像 等 都 是 目前 再 电离 探测 数据 处 理 中 的 难点 。 除 了 宇宙 
黎明 和 再 电离 时 期 探测 ， 射 电源 低频 波段 辐射 性 质 的 研究 、 星 系 团 弥散 辐射 研究 、 高 红 移 类 
星体 在 低频 射电 波段 的 辐射 研究 等 都 是 低频 观测 的 重要 科学 方向 ， 这 些 科 学 目标 的 实现 都 
依赖 于 完善 的 数据 处 理 方法 ， 也 同样 无 法 避 开 REI 的 扣除 、 提 高 校准 精度 等 问题 。 

CASAT, MTRIAD ,ATPS 四 是 目前 可 以 使 用 的 面向 射电 干涉 阵列 数据 处 理 的 基本 软件 包 。 
SKA 探 路 者 阵列 ， 如 LOFAR, MWA, GMRT, 21CMA 等 ， 目 前 已 经 形成 了 面向 不 同 科学 
目标 的 低频 射电 干涉 阵列 数据 处 理 的 基本 流程 ， 并 且 新 的 算法 在 不 断 更 新 中 。 然 而 ， 为 了 应 
对 未 来 SKA 更 高 精度 和 更 大 数据 量 的 数据 处 理 需 求 ， 目 前 的 数据 处 理 方法 在 校准 、 成 像 以 
及 统计 测量 等 方面 依然 有 待 提升 。 本 工作 将 针对 探测 宇宙 再 电离 这 一 SKA 重要 科学 目标 ， 
对 目前 SKA 探 路 者 阵列 所 涉及 的 基本 数据 处 理 方法 以 及 目前 常用 的 数据 处 理 软件 包 进 行 梳 
里 和 总 结 。 
第 2 章 介 绍 低频 射电 干涉 阵列 观测 的 基本 原理 ， 射 电 干涉 阵列 观测 数据 的 基本 人 处理 ， 
包括 干扰 剔除 、 主 为 改正 、 校 准 等 ; 第 3 章 介绍 宇宙 再 电离 探测 的 可 视 度 研 究 和 成 像 研 究 ; 
第 4 章 对 面向 宇宙 再 电离 探测 的 基本 数据 处 理 流程 进行 介绍 ; 第 5 章 进 行 总 结 与 讨论 。 


2 低频 射电 干涉 阵列 数据 处 理 方法 


2.1 (eau 


ANS EB pe 可 视 度 (visibility) 的 理论 基础 ， 以 及 干涉 
阵列 的 基本 参数 分 sre, 35 0 
对 于 两 个 距离 为 L 的 天 线 i 和 7， 观 测 频率 为 vw， 在 时 间 t 时 ， 接 收 到 的 信 过 天 线 
的 电压 响应 可 以 表示 为 : 
Vilta) = Galt) f B6) Gs (1) 


® 
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和 
A | B,(s!\By(s!)d2s'e“O* ， (2) 


其 中 ，G 和 B ab al AKA ATS ak A SE PEM DY PR, vy 表示 频率 ，s 表示 天 空中 的 位 置 ，At 
表示 两 个 天 线 接收 到 同一 信号 的 时 间 差 ， 表示 观测 信号 电场 E 的 第 k fr t mp. 
可 视 度 可 以 通过 两 个 电压 的 互相 关 来 计算 ， 即 : 


Vij = GG 4 Bi(s)Ex(s)a°s} COOS . (3) 


如 图 四 所 示 ， 延 迟 At 与 天 线 之 间 的 距离 以 及 观测 目标 在 天 空中 的 位 置 有 关 ， 可 用 以 波 
长 为 单位 的 地 面 坐 标 系 (u,v, w) 以 及 其 对 应 的 天 空 坐标 系 (1, m, m) 表示 ， 从 而 可 得 : 


didm 


Vi;(u, v, w) = G;G; / f Bij(lm)| Ex me eer) . (4) 
在 小 天 区 近似 n= VI-P—m? = 1 下， 可 得: 
Vij (u,v) & GiGi f f B;;(l, m)|Ex (I,m) Pr tmlqidm . (5) 


可 视 度 


注 : 其 中 OB WERKE, Vi 和 V; 为 两 个 天 线 输出 电压 ， 设 备 延迟 表示 为 7;， 地 理 延迟 表示 为 rr， 由 基线 长 


度 以 及 观测 目标 与 天 顶 之 间 的 夹 角 决 定 ， 对 输出 的 电压 两 两 相关 得 到 可 视 度 信号 。 


1 ”低频 射电 相关 干涉 原理 图 


而 射电 干涉 阵列 的 空间 分 辨 率 可 用 = à 计算 ， 其 中 入 为 观测 信号 波长 ，D 为 观测 时 
使 用 的 最 长 基线 的 长 度 。 
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干涉 系统 的 灵敏 度 计 算 方 法 与 单 天 线 的 类 似 ， 单 个 天 线 望 远 镜 的 流量 密度 误差 为 
Tsyse” 

AV2tAv ' 

其 中 ，M 是 额外 损耗 的 调整 因子 ，k IKRAM Tys 为 系统 亮 温 度 ，7 为 大 气 光 深 ， 

A. 为 单个 天 线 的 有 效 接 收 面积 ， 这 里 的 t 指 的 是 积分 时 间 ，Aw 为 积分 的 频率 带宽 。 而 对 于 

n 个 独立 望远镜 的 干涉 阵列 来 说 ， 有 N = n(n 一 1)/2 个 相关 的 天 线 对 ， 则 流量 密度 的 误 

差 为 : 


AS, =2Mk (6) 


Tiyse* 
AQV2NtAv ` 
所 以 干涉 阵列 的 灵敏 度 由 观测 时 间 、 频 率 带 宽 和 天 线 的 有 效 面积 等 参数 共同 决定 。 
对 于 再 电离 观测 ， 由 于 再 电离 的 信号 十 分 微弱 ， 大 约 只 有 0.01 K， 灵 敏 度 要 达到 信和 号 
水 平 需 要 长 时 间 积 分 累积 ， 给 出 的 是 红 移 为 8.95， 积 分 时 间 1000 h 时 ， 观 测 噪声 随 图 
像 分 辨 率 的 变化 一 ， 这 里 图 像 的 积分 频率 带宽 与 分 辨 率 对 应 ， 即 将 分 辩 率 换算 成 对 应 红 移 
z= 8.95 处 的 距离 ， 再 把 距离 换算 成 对 应 视线 方向 的 频率 范围 。 可 以 看 出 ， 即 使 是 1000 h 
的 积分 时 间 ， 对 于 SKA1-LOW 也 至 少 需要 大 约 4， 即 视线 方向 上 18.3 kpe 对 应 的 频率 带 
宽 的 积分 ， 才 能 使 观测 噪声 达到 EoR, 信号 以 下 。 


AS, =2Mk (7) 


10? 
— SKA1 50% 
— SKA1 
— SKA 

10! 


0 5 10 15 20 
分 辩 率 /() 


VE: 红 移 为 8.95， 积 分 时 间 等 于 1000 h。 不 同 的 曲线 代表 不 同 完 成 度 的 SKA 阵列 ， 即 其 对 应 公式 (四 中 的 
N 不 同 ，SKA 50% (绿色 ) 指 只 有 SKA1-LOW 的 一 半 阵 列 的 情况 ，SKAL (WE) 对 应 全 部 SKA1-LOVV， 
SKA (红色 ) 则 表示 所 有 SKA2-LOW 阵列 的 情况 ， 其 灵敏 度 是 SKA1-LOW 的 4 倍 。 这 里 测试 的 SKA PE 
列 使 用 2012 年 发 布 的 SKA1-LOW 的 基线 排 布 方案 @， 两 条 横 线 分 别 表示 0.01 K ( 玫 红 )， 和 0.001 K (天空 
蓝 )，0.01 K 为 理论 估计 的 EoR 信号 的 强度 。 


图 2 ”观测 图 像 噪声 随 成 像 分 辨 率 的 变化 到 


此 外 ， 在 动态 范围 上 ， 由 于 再 电离 信号 与 前 景 之 间 相 差 4 ~ 5 个 量 级 ， 使 得 观测 的 动态 
范围 要 达到 4 ~ 5 个 量 级 ， 才 能 对 其 进行 观测 。 若 要 进行 再 电离 时 期 成 像 研究 ， 需 要 在 每 
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一 个 空间 /频率 分 辨 率 构 成 的 单元 内 EoR 信号 的 信 噪 比 达 到 1 以 上 。 现 有 的 设备 如 MWA,， 
LOFAR 等 阵列 ， 由 于 灵敏 度 的 限制 ， 可 以 通过 增 大 分 辨 率 单元 ， 即 在 高 于 分 辨 率 的 范围 
内 进行 平滑 ， 和 增加 观测 时 间 的 做 法 ， 以 减少 噪声 ， 具 体 可 以 参考 Zaroubi A" 的 做 法 ， 
他 们 最 终 给 出 的 LOFAR 成像 分 辩 率 大 约 为 20'， 而 如 果 LOFAR 进行 功率 谱 研 究 ， 角 分 交 
率 大 约 为 35。 然 而， 即使 是 这 样 的 成 像 分 辨 率 ， 依 然 需 要 2400 h 的 积分 时 间 才 能 较 好 地 重 
构 出 输入 的 再 电离 信号 ， 所 以 目前 国际 上 已 经 运行 的 射电 望远镜 阵列 主要 进行 再 电离 信号 
统计 特性 ， 如 功率 谱 的 研究 。 而 对 于 未 来 的 SKA1-LOW 来 说 ， 它 的 灵敏 度 足够 高 ， 对 于 
0.001 K 的 信号 来 说 ， 在 角 分 量 级 的 分 辨 率 下 ， 只 需要 频率 积分 时 间 达 到 Bt = 1000 MHz-h 
就 可 以 使 信 噪 比 达 到 1 以 上 ， 所 以 具备 成 像 研究 的 条 件 。 而 在 观测 视 场 上 ， 进 行 再 电离 时 
期 成 像 研究 需要 不 小 于 19 的 视 场 以 完整 呈现 再 电离 气泡 。 
2.2 ”数据 检验 

获得 射电 干涉 阵列 的 观测 数据 ， 即 可 视 度数 据 时 ， 首 先 可 以 通过 数据 的 统计 性 质 来 检验 


aK 


数据 质量 ， 根 据 观 测 数据 的 质量 来 判断 数据 是 否 可 以 被 使 用 ， 以 及 决定 后 续 工 作 采 用 的 数据 
T 处 理 管线 。 通 常 可 以 通过 数据 点 的 数目 、 平 均值 及 标准 差 等 进行 检验 。 
数据 点 数目 是 判断 观测 数据 质量 的 标准 之 一 ， 包 括 不 同 频率 带宽 内 数据 点 的 数目 、 不 同 
q 时 间 间 隔 内 数据 点 的 数目 以 及 不 同 基线 和 极 化 方向 上 测量 的 数据 点 的 数目 。 在 数据 处 理 中 ， 
q É FERIU 8 v FLA T Ti v Fe] A] LPH AT ER, FREARS ERRE, tH 
c AA IB RETE OF. STP FIAR B A B] 28048 n3 286 HE TH] CAA iT AC o Eo 
(O 数据 点 的 平均 值 和 标准 差 是 检验 观测 数据 质量 的 两 项 重要 统计 性 质 ， 平 均值 可 以 估算 
e 观测 的 信 噪 比 并 了 解 天 线 的 增益 ， 而 标准 差 则 可 用 以 判断 观测 数据 的 可 靠 性 ， 通 过 剔除 在 时 
A 间 、 频 率 空间 和 使 用 不 同 基线 时 标准 差 发 生 较 大 变化 的 数据 点 ， 从 而 减少 这 些 数据 点 对 数据 


C 校准 造成 的 影响 。 
N 目前 的 射电 阵列 数据 处 理 中 ， 有 一 些 常用 的 工具 可 以 进行 数据 质量 检验 ， 如 aogplot ™ 
p TA“, MWA 和 LOFAR 等 一 些 低 频 阵列 就 是 使 用 aoqplot 进行 数据 质量 的 检验 。 
2.3 “干扰 剔除 

在 射电 观测 中 ， 尤 其 是 低频 波段 ， 存 在 射电 干扰 ， 需 要 进行 干扰 的 识别 与 剔除 。 虽 然 射 
= 电 望 远 镜 阵列 一 般 都 会 建 在 射电 宁静 区 域 ， 但 是 随 着 科技 的 发 展 ， 理 想 的 射电 宁静 区 域 非常 
rr 稀少 ， 所 以 干扰 信号 的 识别 和 剔除 是 射电 望远镜 阵列 数据 处 理 过 程 中 不 可 避免 的 步骤。 图 
Bid T 21CMAS M LOFAR T 观测 中 出 现 的 射电 干扰 信号 。 这 些 干扰 主要 来 自 于 调频 广 
播 、 卫 星 通信 、 航 空 通信 ， 以 及 电离 层 和 对 流 层 引起 的 散射 效应 ， 除 此 之 外 还 有 一 些 影响 时 
标 比 较 短 的 干扰 信号 ， 如 闪电 、 流 星 余 迹 的 反射 等 。 

对 于 不 同性 质 的 干扰 信号 ， 需 要 采用 不 同 的 方法 进行 识别 和 剔除 。 如 特定 频率 工作 的 卫 
星 信 号 ， 可 以 在 频率 空间 进行 识别 和 吻 除 ， 飞 机 经 过 望远镜 阵列 时 散射 无 线 电 广播 信号 ， 可 
以 在 时 域 进行 识别 和 剔除 。 对 于 比较 强 的 干扰 信号 ， 无 论 是 在 频 域 还 是 时 域 ， 识 别 起 来 相对 
容易 ;但 对 于 相对 微弱 ， 而 且 特 征 不 明显 的 干扰 信号 ， 需 要 通过 特定 算法 进行 识别 和 剔除 。 
同时 随 着 观测 数据 量 的 增 大 ， 需 要 通过 自动 高 效 的 干扰 识别 方法 来 保证 数据 质量 ， 从 而 满足 
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5% ~ 20% 的 数据 。 


主 : a) 21CMA 观测 信号 瀑布 
部 分 时 间 内 功率 平均 后 的 频谱 分 布 图 
机 信号 。b) LOFAR 低频 段 天 线 
频谱 中， 受 RFI 影响 
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图 3 


图 以 及 REFIICSI ， 上 半 部 分 是 频率 信号 随时 间 变 化 的 瀑布 图 ， 下 半 部 分 黑 线 是 上 


。 绿 直线 为 周边 调频 广播 频段 ， 而 144 MHz 处 的 强 干 扰 可 能 来 自 对 


(low-band antenna, LBA: 10 ~ 80 MHZ) 6 h 观测 得 到 的 含有 REI 的 
较 小 的 子 带 (sub band) 中 去 除 掉 的 数据 不 到 1%， 然 而 RFI 影响 较 大 的 时 需要 去 除 
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1 期 何 梦 钒 ， 等 ， 面 向 宇宙 再 电离 探测 的 基本 数据 处 理 方法 119 


目前 面向 低频 射电 阵列 观测 数据 的 干扰 识别 和 剔除 方法 包括 AOF lagger ”和 FLAGCAL” 
等 。AOFlagger 在 进行 干扰 识别 时 使 用 了 和 阅 值 (sum threshold) 方法 。 背 景 拟 合 技术 以 及 
结合 形态 算 子 (morphological operators) 等 ， 从 而 能 够 快速 准确 地 识别 射电 干涉 阵列 观测 数 
据 中 的 干扰 信号 ， 目 前 已 被 应 用 于 MWA 和 LOFAR 等 阵列 的 数据 处 理 中 。 而 FLAGCAL 基 
于 良好 的 可 视 度数 据 在 时 间 和 频率 上 是 连续 的 原则 ， 来 对 可 视 度 数据 进行 识别 。 然 后 它 通过 
已 知 的 流量 和 相位 定 标 源 进行 校准 ， 再 使 用 球面 线性 插值 到 目标 场 ， 从 而 实现 对 较 差 的 可 
视 度 数据 进行 识别 和 和 剔除， 其 被 应 用 于 GMRT 的 数据 处 理 中 。 在 进行 干扰 的 识别 和 剔除 之 
后 ， 通 常会 形成 一 个 记录 文件 ， 包 括 被 剔除 的 数据 点 的 相关 信息 ， 以 便 后 续 查 看 和 调用 。 
Gao 等 人 "提出 一 种 对 毫秒 时 间 尺 度 上 射频 干扰 源 进行 提取 的 方法 ， 该 方法 可 对 输入 
信号 频谱 瀑布 图 ， 利 用 Canny 边缘 检测 算法 与 Hough 寻 线 算法 来 识别 射电 干扰 信号 ， 并 将 
这 一 方法 应 用 到 21CMA 观测 数据 处 理 上 ， 发 现 该 算法 对 于 特定 的 短 时 标 、 强 干扰 信号 的 证 
认 准 确 率 可 以 达到 9096. 

现 有 的 REI 剔除 对 于 一 些 特定 频率 (窄带 )、 特 定 宽度 的 RFI 能 够 有 效 剔 除 ， 但 仍 有 
一 些微 弱 和 干扰， 无 法 被 识别 和 剔除 。Wilensky 5 AP" 使 用 MWA 的 快速 全 息 反 卷 积 (fast 
holographic deconvolution, FHD) /eppsilon 管线 研究 了 RFI 对 于 EoR 功率 谱 探测 影响 。 结 
果 发 现 ， 即 使 是 微弱 的 RFI 都 可 能 掩盖 在 0.1 < k< 2h. Mpo 范围 内 ， 只 有 大 约 0.01 K? 
的 EoR fi 5. SRA RFI 的 总 流量 值 为 1 mJy 的 情况 下 ， 若 真实 信号 与 他 们 使 用 的 21cm 
FAST 生成 的 乐观 模型 偏差 低 于 10% 的 话 ， 则 EoR 信号 可 以 在 模 有 «0.9 h- Mpc :的 范围 
内 探测 到 。 
2.4” 视 场 外 亮 源 旁 闪 处 理 

如 果 亮 源 存在 于 所 选 定 的 观测 天 区 周围 ， 其 旁 办 会 在 观测 数据 中 产生 一 个 类 似 噪 声 的 
污染 ， 我 们 称 之 为 远 旁 汶 源 噪声 (far side-lobe source noise, FSSN)， 需 要 对 其 进行 处 理 ， 因 
此 在 选取 观测 天 区 时 ， 会 尽量 避免 亮 源 出 现在 观测 视 场 中 以 及 视 场 周围 。 但 是 ， 如 果 基 于 科 
学 目标 的 需求 ， 无 法 避免 亮 源 ， 那 么 需要 对 其 进行 剔除 。 剔 除 观 测 天 区 以 外 亮 源 的 旁 准 影 
响 ， 一 般 通 过 对 源 进行 准确 的 建 模 ， 并 且 扩 大 观测 天 区 ， 从 而 对 其 进行 旁 六 的 改正 ， 保 证 所 
需 观 测 的 区 域 不 受 亮 源 旁 注 的 影响 。 
如 在 21CMA 观测 中 ，21CMA 的 观测 有 效 视 场 是 北 天 极 区 域 5° 半径 的 范围 ， 但 是 有 
效 视 场 外 的 亮 源 产生 的 旁 办 仍然 会 影响 有 效 视 场 。 而 且 21CMA 阵列 采用 元 余 基 线 排 布 ， 因 
此 亮 源 的 机 办 (grating lobes) 也 会 产生 影响 。 目 前 采用 的 处 理 方法 是 对 较 大 的 视 场 进行 成 
像 ， 如 以 北 天 极为 中 心 ， 半 径 10° 以 上 的 区 域 ， 然 后 在 成 像 的 过 程 中 ， 不 但 对 视 场 内 射电 源 
的 劳 办 进行 处 理 ， 也 对 视 场 外 的 亮 源 的 旁 兴 进 行 处 理 。 
另 一 方面 ，FSSN 受 观测 的 UV Eum, Bü UV 覆盖 的 提高 而 降低 。 Mort 等 
人 “使 用 SKA-LOW 的 分 布 进行 FSSN 的 研究 指出 ， 在 观测 时 间 超过 6 h 的 情况 下 ，FSSN 
的 水 平 已 经 低 于 热 噪声 ， 但 是 随 着 观测 时 间 的 进一步 增加 ，FSSN 的 下 降 比 热 噪声 下 降 慢 。 
通过 改变 阵列 的 排 布 或 增加 阵列 的 数目 提高 瞬时 孔径 覆盖 ， 可 以 在 一 定 程度 上 降低 FSSN。 
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2.5 基线、 频率 以 及 观测 时 间 选 择 
如 何 选择 所 需 的 基线 、 
目标 及 数据 质量 。 


(1) 较 短 的 基线 对 应 较 大 尺度 信息 ， 长 基线 则 对 应 小 尺度 信息 。 长 基线 的 使 用 
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频率 以 及 观测 时 间 的 数据 点 进行 下 一 步 的 数据 处 理 ， 取 决 于 科学 


可 以 提高 


数据 的 空间 分 辨 率 ， 然 而 长 基线 受 电离 层 的 影响 更 为 明显 ， 需 要 对 电离 层 变 化 时 在 幅度 和 相 


位 上 造成 的 影响 进行 校准 和 改正 。 


(2) 数据 处 理 采 用 的 频率 带宽 与 最 终 的 灵敏 度 相 关 ， 为 了 在 数 和 
需要 选择 合适 的 频率 带宽 。 
会 避免 出 现 较 强 干扰 时 的 数据 ， 这 一 步 在 进行 干扰 剔除 时 已 


效果 以 及 图 像 质量 ， 
(3) 在 观测 时 间 的 选取 上 ， 


经 进行 了 处 理 。 积 分 时 间 的 长 度 与 灵敏 度 相关 ， H 


Hat 四 ) BIS, AS, oc 1/Vt， 积 分 时 间 越 


中 处 理 中 获得 较 好 的 校准 


长 ， 灵 敏 度 越 高 ， 为 获取 较 微 弱 的 信号 ， 需 要 进行 长 时 间 的 数据 累加 。 但 在 考虑 积分 时 间 的 
同时 ， 也 要 考虑 无 法 分 辨 的 弱 源 产生 的 致 淆 极限 的 影响 。 


2.6 ”天 线 主办 改正 


天 线 主 办 是 天 线 方向 图 上 最 大 的 辐射 波束 ， 与 天 线 的 方向 必 
人 的 宽度 定义 为 场 强 E, 下 降 至 主 泊 最 大 值 的 1/V2 时 两 点 之 间 的 宽度 ， 或 者 功率 P, = E 
下 降 到 最 大 值 1/2 时 两 点 之 间 的 宽度 ， 即 半 功 率 全 宽 (half power beam width, HPBW)。 
在 数据 处 理 中 ， 需 要 考虑 天 线 阵列 主 斩 的 影响 ， 在 不 同 的 观测 频率 进行 改正 。 
量 天 线 主办 是 非常 困难 的 ， 一 些 低频 射电 阵列 ， 如 21CMA 的 主 激 可 以 近似 为 高 斯 形式 


Heb 


EAK, HEMER. E 


F(0,v) = G(v)e-" 2%, 9, 随 频率 的 变化 可 以 写 为 : 0, = 3°.33(4 


合 结果 ， 如 图 团 所 示 。 


这 里 频率 EU MHz 为 单位 。Zhao 4& AP" A y 
Ly 


精确 测 


0.01) (v /100)7 1149-01) ; 


H 21CMA 的 主办 宽度 随 频 率 的 变化 以 及 拟 


e. 


ik: gb 指 的 是 近似 为 高 斯 形 主流 高 斯 分 布 的 标准 差 ， 黑 色 数 据点 是 对 子 频 
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段 带宽 为 1.56 MHz 得 到 的 图 像 上 拟 


合 得 到 的 gb ， 对 频率 范围 65 ~ 200 MHz 的 黑 


IÈ Oy = 3°.33(4£0.01)(v/100)~ 1 1449-9) 5 


图 4 
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进行 描述 ， 这 是 
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行 拟 合 得 到 最 佳 拟 合 结果 
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1 期 何 梦 钒 ， 等 ， 面向 宇宙 再 电离 探测 的 基本 数据 处 理 方法 121 
定性 会 对 如 宇宙 再 电离 探测 等 科学 目标 的 实现 造成 不 可 忽略 的 影响 ， 而 从 可 视 度数 据 上 测 
量 天 线 主 汶 ， 由 于 会 受到 来 自 仪 器 、 大 气 以 及 多 种 影响 因素 的 共同 作用 ， 从 而 变 得 十 分 蒜 
难 。 该 工作 使 用 了 在 对 数据 进行 数字 化 及 相关 计算 前 ， 从 天 线 接收 单元 进行 主办 分 析 等 技 
术 。Barry 等 人 ”研究 了 再 电离 探测 对 于 校准 需求 后 指出 ， 再 电离 观测 要 求 频率 方向 上 的 误 


差 不 高 于 10-5， 这 也 意味 着 天 线 主 办 的 校准 误差 造成 的 信号 在 频率 方向 j 
信号 低 5 个 量 级 以 上 ， 才 能 进行 再 电离 探测 。 
2.7 ”校准 

实际 观测 到 的 射电 源 的 亮度 和 位 置 与 真实 的 亮度 和 位 置 会 出 现 偏差 ， 因 此 须 对 观测 数 
据 进行 校准 之 后 才 具 有 科学 使 用 价值 。 校 准 的 方式 之 一 是 通过 定 标 源 进行 校准 。 定 标 源 可 以 
分 为 流量 和 相位 定 标 源 。 在 射电 干涉 阵列 观测 时 ， 需 要 通过 观测 相位 定 标 源 来 对 相位 中 心 进 
行 校准 ， 同 时 需要 使 用 流量 定 标 源 对 最 终 的 观测 流量 进行 校准 。 在 望远镜 阵列 相位 和 增益 不 
稳定 的 情况 下 ， 需 要 在 观测 的 过 程 中 对 定 标 源 进行 多 次 观测 ， 通 常 在 观测 的 开始 和 结束 时 进 
行 定 标 源 的 观测 。 如 果 观 测 时 间 较 长 ， 需 要 对 定 标 源 进行 周期 性 的 观测 ， 从 而 实现 对 相位 和 
流量 的 修正 。 校 准 的 另 一 种 方式 称 为 自 校准 ， 是 对 天 线 阵列 及 仪器 本 身 的 校准 。 可 以 通过 闭 
合 关 系 来 实现 天 线 各 基线 之 间 的 自 校准 ， 从 而 修正 各 阵列 之 间 的 差异 ， 同 时 也 可 以 通过 使 用 
强 信号 源 ， 来 实现 对 天 线 阵列 和 仪器 的 校准 。 

天 线 真实 的 指向 ， 即 主办 中 心 的 位 置 ， 与 预定 的 指向 位 置 存在 偏差 。 天 线 指 向 造成 的 偏 
差 是 方向 依赖 的 ， 并 且 会 随时 间 变 化 。 通 过 观测 不 同 天 区 的 已 知 位 置 的 射电 源 ， 可 以 得 到 天 
线 指向 误差 的 方向 依赖 特性 。 如 果 射 电源 的 强度 已 知 ， 那 么 可 以 通过 测量 射电 源 的 强度 与 可 
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视 度 幅 度 的 比值 来 测量 天 线 在 不 同方 向 上 的 增益 。 在 射电 
如 果 随 频率 发 生变 化 ， 那 么 就 需要 对 每 个 频带 内 的 天 线 增 
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么 可 以 采用 元 余 基 线 校 准 来 对 观测 数据 进行 改正 。 但 1 
基线 进行 校准 。 

通过 输入 源 的 模型 来 求解 天 线 增益 ， 进 行 对 可 视 度 的 改正 ， 基 于 改正 的 可 视 度 


的 求解 。 如 此 循环 ， 直 到 形成 模型 趋 近 于 输入 模型 。 通 过 这 种 方 


的 排 布 模式 ， 


模型 ， 再 次 进行 对 天 线 增益 
法 可 以 对 天 线 系统 间 的 差异 进行 校准 。SAGECAL (Space Alternating Generalized Expectation 
Maximization Calibration 癌 是 可 以 实现 这 一 步 又 的 射 
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除了 依赖 于 定 标 源 的 校准 方法 ， 在 射电 


上 ， 以 及 在 某 些 观测 中 ， 所 需 观 测 的 视 场 还 可 能 缺少 到 


时 ， 地 面 观测 无 法 避免 会 受到 
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昌 存 在 相同 的 间 B 
于 许多 天 线 阵 列 并 不 采 上 月 


阵列 校准 软件 包 之 一 ” 。 
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使 用 的 天 空 模型 可 以 包含 shapelets 拟 合 的 成 分 、 盘 状 结构 、 环 状 结构 、 高 斯 成 分 以 及 标 
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天 文学 进展 


MWA 射电 望远镜 阵列 目前 采 ) 


21CMA 阵列 也 采用 元 余 基 线 的 排 布 形式 ， 


法 和 基于 天 空 模型 的 校准 方法 。 
2.8 KARA 


] 元 余 基 线 校准 和 基于 天 空 模型 的 校准 方法 ”。 由 于 


因此 在 校准 方法 上 也 可 以 采 


] 元 余 基线 的 校准 方 


Barry 等 人 "使 用 MWA EoR 观测 FHD/eppsilon 管线 进行 仪器 校准 影响 的 研究 表明 ， 


提高 校准 精度 ， 同 时 也 是 研究 射电 源 


使 用 一 个 理想 的 校准 模型 ， 可 以 完美 地 重 构 出 输入 的 EoR 信号 ， 但 是 现 
盖 所 有 的 源 ， 而 已 有 的 源 中 也 无 法 做 到 涡 


扣除 或 是 前 景 规避 也 一 定 程度 上 依赖 于 人 们 对 前 景 的 认 知 。 所 以 ， 建 立 理 


工作 。 射 电源 天 空 模型 的 建立 首先 是 射 日 


的 星 表 都 无 法 涵 


上 量 的 流量 、 位 置 、 形 态 毫 无 误差 。 另 一 方面 ， 前 景 
E 想 的 天 空 模型 可 以 
性 质 以 及 宇宙 黎明 和 再 电离 时 期 探测 前 景 去 除 的 重要 


E 源 的 搜索 与 识别 ， 然 后 是 模型 的 建立 ， 尤 其 是 对 结 


构 复杂 的 弥散 源 进行 模型 建立 。 以 21CMA 数据 处 理 为 例 ， 使 用 了 40 个 射电 源 形成 天 空 模 


型 ， 对 北 天 极 区 域 半 径 5° 范围 内 的 天 


YE: 21CMA 观测 的 北 天 极 (North Celestial Pole, NCP) 附近 ， 每 个 加 


NCP 90?。 红 色 圆 圈 


EE 


出 的 是 校准 时 使 用 的 


图 5 21CMA 频率 50 ~ 200 MHz 的 生成 的 天 空 图 像 四 


40 个 定 标 源 。 


目前 有 许多 工具 都 可 以 用 来 进行 射电 源 搜索 和 建 模 ， 主 要 有 五 种 。 


区 进行 校准 ， 如 Zhao 等 人 ”给 出 的 图 日 所 示 。 


为 半径 1° 的 天 空 图 像 ， 最 中 心 为 


(1) PyBDSF (Python Blob Detection and Source Finder)™ ( 原 为 PyBDSM) 是 基于 图 像 的 


射电 源 搜索 Python 软件 包 ”， 可 以 输出 射电 源 列 表 文件 ， 包 含 源 的 位 置 、 


于 结构 复杂 的 射电 源 ，PyBDSF 将 使 ) 


PyBDSF 也 可 以 对 其 进行 Shapelets 分 解 。 由 于 射电 图 像 会 存在 许多 处 到 


流量 等 信息 。 对 


过 程 中 引入 的 假 结 


] 多 个 椭圆 高 斯 的 形式 进行 拟 合 ， 对 于 延展 性 较 强 的 源 ， 
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构 ， 这 些 假 结构 也 会 被 PyBDSF 识别 成 射电 源 ， 可 以 通过 对 流量 限制 等 参数 进行 
避免 识别 出 假 源 。 
(2 ) 基于 搜索 出 的 射电 源 ， LSMTool® 软件 包 可 进一步 选择 并 构建 天 空 模型 。 
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调整 ， 尽 量 


除了 包含 


PyBDSF 搜索 的 源 ，LSMTool 还 可 以 通过 特定 的 分 类 函数 对 CLEAN 形成 的 成 分 进行 射电 源 天 


空 模型 的 建立 。 对 于 弥散 源 ， 其 弥散 成 分 可 以 通过 Shapelets 来 进行 模型 建立 ， 


含 大 斥 度 弥 散 结构 的 射电 源 ， 如 星系 团 射 电 棠 、 射 电 遗 迹 等 建立 较为 精确 的 模型 。 图 回 展 


示 了 使 用 LSMTool 构建 的 天 空 模型 。 


赤 纬 /(?) 


赤 经 外 


从 而 对 包 


注 : 不 同 的 颜色 代表 不 同 的 天 空 区 块 (sky patches)， 不 同 的 形状 表示 源 的 不 同形 态 类 型 ， 如 圆 形 表示 
型 表示 高 斯 形态 的 源 等 。 


6 ， 使 用 LSMTool 构建 出 的 天 空 模型 的 简单 图 示 


(3) Aegean 也 是 一 种 基于 射电 图 像 的 源 搜索 识别 工具 ， 它 主要 针对 的 
的 致密 源 的 查找 与 拟 合 。 与 PyBDSF 类 似 ，Aegean 对 于 图 像 进行 源 查找 拟 合 rd 
源 的 位 置 、 流 量 等 信息 的 列表 文件 ， 并 且 对 于 延展 源 以 及 解析 的 结构 ，Aegean 


mu, E 


是 高 斯 形态 
后 输出 包含 
采用 多 椭圆 


高 斯 登 加 的 拟 合 模型 。Aegean 程序 主要 可 分 为 两 个 部 分 。 第 一 部 分 ,“ 岛 ”的 搜索 与 界定 。 
这 里 “ 岛 ” 指 的 是 在 设 定 信 吕 比 闵 值 以 上 的 像素 连 成 一 片 的 区 域 ， 它 由 两 个 可 由 用 户 设 定 的 


信 品 比 阔 值 决 定 : 一 个 是 种 子 闹 值 ， 只 有 像素 点 上 的 信 品 比 大 于 这 个 阐 值 ， 才 


认为 有 源 存 


在 ， 以 这 些 像素 点 为 中 心 ， 向 外 延伸 的 区 域 中 ， 信 咯 比 大 于 另 一 个 洪 阔 值 的 区 域 被 认为 是 这 
个 源 存在 影响 的 区 域 。 只 有 这 些 区 域内 的 数据 后 续 才 被 用 来 进行 源 的 位 置 、 流 量 、 形 态 等 信 


息 的 测量 。 第 二 部 分 ， 根 据 原 图 计算 曲率 图 来 获得 拟 合 采取 的 组 分 数目 和 每 个 
数 ， 进 而 对 证 认 出 的 岛 进 行 参数 拟 合 。 

(4) Duchamp” 可 用 于 三 维 数据 中 源 的 查找 ， 它 同样 可 以 应 用 于 二 维 数据 ， 
维 数据 上 。 为 了 提高 源 查找 的 完备 性 和 准确 性 ， 程 序 提供 了 几 种 预 处 理 方法 


https: github.com/darafferty/LSMToo 


组 分 初始 参 


甚至 是 一 
以 减少 数据 
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中 的 误差 ， 根 据 预 处 理 的 方法 不 同 又 可 以 分 为 Duchamp basic, Duchamp smooth, Duchamp 
atrous。 其 中 Duchamp smooth 是 对 数据 使 用 定义 的 核 进行 卷 积 平滑 ， 而 Duchamp àtrous 
是 一 种 利用 基于 多 分 辨 率 小 波 变 换 的 atrous 算法 来 降低 数据 误差 的 方法 。Duchamp 对 预 处 
理 过 后 的 数据 进行 源 的 搜索 ， 搜 索 方 式 与 Aegean 类 似 ， 也 是 采用 设 定 信 噪 比 阔 值 的 方法 ， 
识别 出 源 所 在 的 pixel， 对 这 些 识别 出 来 的 源 像素 进行 参数 化 ， 输 出 积分 流量 、 加 权 中 心 、 
主轴 等 信息 的 表格 ， 同 时 输出 的 还 有 源 的 图 像 LE). 


00h5min6s 24min48s 23min36s 22min48s 


| " L 4 L n 4 
2 000 4 000 6 000 8000 10000 12000 1578.9 1982.55 
V/(km:s?) V/(km-:s?) 


ik: 绿色 线条 框 出 的 区 域 是 识别 出 来 的 源 ， 每 个 源 中 间 的 十 字 叉 标注 的 是 源 的 加 权 中 心 的 位 置 ， 边 上 的 数字 为 输 
出 列表 中 源 的 序号 。 


7 Duchamp FERARI 


(5) Buildsky” 是 基于 不 损失 精度 的 前 提 下 ， 对 源 使 用 最 少 的 组 分 而 开发 的 ， 被 用 于 
LOFAR 数据 的 自动 化 天 空 建 模 。Buildsky 通过 对 给 定 的 源 选取 合适 的 自由 度 以 达到 建立 


1 期 何 梦 钒 ， 等 ， 面 向 宇宙 再 电离 探测 的 基本 数据 处 理 方法 125 


最 简 模型 的 目的 。 例 如 点 源 只 有 一 个 自由 度 ， 即 它 的 形状 ， 更 复杂 的 源 自由 度 更 高 ， 最 佳 的 
自由 度数 目 根 据 信 息 论 标准 来 决定 。Buildsky 对 一 个 较为 复杂 延展 源 的 致密 中 心 进行 拟 合 
的 结果 如 图 加 所 示 。 值 得 注意 的 是 ，LOFAR 对 于 延展 的 结构 会 使 用 Shapelets 对 其 建 模 。 


ik: 绿色 圆圈 为 对 这 一 部 分 进行 建 模 使 用 的 5 个 点 源 。 


8  Buildsky 建 模 结果 品 


除 此 以 外 的 射电 源 搜索 与 识别 的 软件 还 包括 IFCA "7". APEX”， 以 及 可 以 进行 实时 暂 
现 源 搜 索 的 PysE" 等 。 


3 宇宙 再 电离 探测 的 可 视 度 研究 和 成 像 研究 


3.1 ”可 视 度 研究 

低频 射电 阵列 可 以 在 UV 空间 直接 进行 可 视 度 研究 ， 如 在 宇宙 再 电离 探测 中 ， 可 以 在 
UV 空间 直接 构建 功率 谱 ， 对 宇宙 再 电离 信号 的 统计 性 质 进行 研究 ， 从 而 避免 在 成 像 过 程 中 
由 傅 里 叶 变 换 以 及 格 点 化 带 来 的 误差 。 来 自 于 天 空 和 仪器 的 噪声 通常 可 以 近似 为 高 斯 形式 ， 
直接 的 傅 里 叶 变 换 也 不 会 影响 噪声 的 性 质 。 然 而 ， 如 果 采 用 一 些 非 线性 的 方法 ， 如 CLEAN 
方法 对 图 像 进行 处 理 ， 那 么 噪声 的 性 质 就 会 偏离 原 有 的 高 斯 属性 。 因 此 ， 直 接 对 可 视 度 进行 
研究 可 以 较 容易 地 对 噪声 进行 处 理 。 图 日 展 示 了 21CMA 阵列 24 h 观测 得 到 的 可 视 度 数据 ， 
可 视 度 数据 构成 的 圆 环 中 ， 由 内 到 外 对 应 频率 50 ~ 200 MHz， 每 个 频率 对 应 的 圆 上 ， 不 同 
位 置 对 应 不 同时 间 的 观测 ，24 h 的 观测 数据 正好 构成 一 个 完整 的 圆 形 。 

由 于 电离 层 的 影响 和 天 线 增益 的 变化 ， 需 要 对 可 视 度 的 实 部 和 虚 部 进行 校准 。 通 常情 况 
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ik: 其 中 环形 由 内 到 外 对 应 频率 50 ~ 200 MHz， 每 个 频率 对 应 的 圆 上 ， 不 同位 置 对 应 不 同时 间 的 观测 ，24 h 
的 观测 数据 正好 构成 一 个 完整 的 圆 形 ， 圆 环 在 右边 偏 上 ， 和 底部 偏 右 有 两 处 缺失 是 对 数据 在 UV 平面 初步 进行 得 
查 时 会 直接 剪 切 掉 的 存在 干扰 ， 或 缺少 观测 的 数据 。 


9 21CMA 观测 的 UV 图 像 


下 ， 对 可 视 度 的 校准 可 以 通过 自 校准 来 实现 。 在 自 校准 效果 不 理想 的 情况 下 ， 可 以 通过 闭合 
关系 对 可 视 度 的 实 部 和 虚 部 进行 校准 。 然 后 通过 在 UV 空间 绘制 观测 数据 点 ， 或 者 绘制 观 
测 数 据点 幅度 和 观测 尺度 (基线 长 度 ) 的 关系 来 进行 数据 检查 。 

针对 不 同 的 科学 目标 ， 在 数据 处 理 的 过 程 中 选择 不 同 的 权重 方式 。 

(1) 均匀 权重 。 每 个 格 点 的 权重 W 反比 于 该 格 点 上 所 包含 数据 点 的 个 数 N， 即 : 


1 
N (ui, vj) ? (8) 


RP, u, v; 表示 UV FEER AME. LSA A PSE ER, IF A SB 
弱 ， 但 是 在 一 定 程度 上 牺牲 了 灵敏 度 。 

(2) 自然 权重 。 每 个 格 点 的 权重 为 该 格 点 上 数据 点 的 数目 ， 假 设 格 点 上 的 数据 点 数目 服 
从 正 态 分 布 ， 则 : 


Wh (wi, vj) = 


1 
c? (ui, vj) (9) 
EPA HES SUIS] ABBA FK I KP, (AR SEXE IE. SRA, CA UV TE 
均匀 时 ， 自 然 权 重 与 均匀 权重 的 效果 相似 。 

(3) Briggs 权重 (Robust 权重 )。 兼 顾 分 状 素 和 旁 淮 影 响 ， 它 通过 调节 稳健 参数 来 控制 
前 面 所 述 两 种 方法 的 作用 程度 。 图 四 给 出 了 几 种 权重 的 成 像 效 果 。 


Wh (ui, vj) 一 N (ui, vj) vi 
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D 


纬度 偏离 /(°) 
ui 
光束 流量 /Jy 


iy 


0 
经 度 偏离 /(?) 
a) 


YE: a) BARE; b) 均匀 权重 ; c) Briggs 权重 。 


10 “ 几 种 权重 作用 效果 的 比较 ” 


3.2 ”成 像 研究 

除了 对 UV 空间 的 数据 进行 统计 研究 ， 还 可 以 依据 科学 目标 的 需求 ， 通 过 对 可 视 度 数据 
进行 逆 传 里 叶 变 换 ， 从 而 生成 图 像 。 图 加 是 图 加 经 过 逆 传 里 叶 变 换 生 成 的 天 图 。 在 使 用 逆 传 
里 叶 变换 时 ， 需 要 对 数据 进行 格 点 化 。 由 于 望远镜 阵列 UV 覆盖 的 不 完备 ， 需 要 通过 CLEAN 
等 算法 进行 修正 ， 形 成 理想 的 射电 图 像 ，Cotton-Schwab CLEAN” 是 比较 常用 的 CLEAN 算 
法 过 一 

在 使 用 射电 干涉 阵列 观测 数据 进行 成 像 时 ， 需 要 考虑 W 项 (UVW 坐标 中 ，W 项 表示 
视线 方向 ) 的 影响 ， 可 以 使 用 的 方法 主要 包括 W 项 投影 (W-projection)”” 和 W H&H 
(W-stacking)”。21CMA 阵列 分 东西 和 南北 两 条 基线 ， 如 果 只 使 用 东西 基线 进行 观测 ， 就 
可 以 简化 数据 处 理 过 程 ， 避 免 W 项 的 影响 。MWA, LOFAR 以 及 未 来 SKA 阵列 的 天 线 阵 
排 布 则 无 法 避免 考虑 W 项 的 影响 。 在 目前 MWA, LOFAR 等 阵列 的 数据 处 理 中 ， 可 以 使 用 
WSClean 算法 ，WSClean 采用 W MAMKE, fEXbfT CLEAN 时 考虑 了 W 项 的 影响 ， 
这 也 是 基于 射电 干涉 阵列 进行 大 视 场 成 像 的 需求 。PURIFY 也 是 基于 射电 干涉 阵列 数据 重建 
图 像 的 方法 ”， 使 用 W 项 投影 和 W 项 二 加 的 方法 进行 大 视 场 成 像 。Pratley EAT 认为 
PURIFY 获得 的 图 像 比 CLEAN 算法 获得 的 图 像 具 有 更 大 的 动态 范围 。 成 像 动态 范围 对 不 同 的 
源 来 说 有 所 区 别 ，Pratley 等 人 ”使 用 PURIFY 对 来 自 甚大 天 线 阵 (Very Large Array, VLA) 
和 澳大利亚 致密 天 线 阵 (Australia Telescope Compact Array, ATCA) 的 数据 进行 的 测试 显 
示 ，PURIFY 的 成 像 动态 范围 在 7 x 105 ~ 1.1 x 10 之 间 ， 而 其 对 应 的 CLEAN 方法 成 像 的 动 
态 范围 只 有 数 百 ( 见 文 献 pm 中 的 表 3)。 其 测试 的 源 均 为 具有 复杂 结构 的 源 ， 都 能 得 到 较 
好 的 成 像 效 果 ， 并 且 其 残 差 图 像 的 均 方 根 要 小 于 使 用 CLEAN 得 到 的 结果 。Pratley 等 人 将 
3C129 射电 星系 使 用 CLEAN 的 成 像 与 PURIFY 成 像 进行 了 对 比 ， 结 果 如 图 中 所 示 。 

在 进行 格 点 化 时 ， 如 果 在 成 像 时 使 用 W 项 投影 的 方法 ， 那 么 需要 考虑 W 项 投影 平面 的 
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YE: a) PURIFY; b) CLEAN. PURIFY Lb CLEAN 具有 更 大 的 成 像 范 围 ， 有 些 情况 下 甚至 能 提高 一 个 量 级 ， 得 到 的 重 


构 结果 也 包含 更 少 的 污染 


数量 ， 同 时 还 要 


需要 考虑 格 点 化 算法 的 计算 成 本 。WSClean Hh fi 


点 


IDG) 的 方法 进行 格 点 化 ，IDG 可 以 同时 i 
里 的 A 项 投影 是 对 方向 依赖 影响 

役 影 ， 在 对 图 像 进行 格 点 化 时 ， 对 方向 依赖 尾 
度 上 与 传统 的 W 项 投影 方法 相当 ， 同 时 
响 进行 改正 
该 工作 认为 格 点 化 不 会 对 功率 谱 测量 造成 影响 ， 
HW 项 个 加 的 情况 。 与 进行 可 视 度 开 


的 影 
LP 


也 适用 于 在 大 视 场 成 像 时 使 月 


Lio 


图 11 


考虑 主办 和 空 


Offringa 5 


的 过 程 中 同样 需要 考虑 不 同上 
青 况 下 得 到 所 需 尺 度 的 信 


灵敏 度 的 | 
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x 间 分 辩 率 


像素 点 流量 /mJy 


的 影响 。 对 于 图 
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gx 


AT spe 


目前 ， 


射电 干涉 阵列 成 像 如 何 


是 吸 待 解决 的 问题 。 


JAX 


E 


4o 


行 改正 的 算 ; 
FE 影响 进行 改正 的 方法 ， 该 方法 在 计 
影 ， 可 以 对 快速 变换 的 方向 
离 信号 功率 i 


EE， 如 均匀 权重 、 


提高 成 像 精度 、 


行 W 


YA 


PURIFY 和 CLEAN 重 构 出 来 的 3C129 射电 星系 加 


因为 加 入 了 A 项 
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光束 流量 /mJy 


间 的 格 点 化 ， 在 数据 量 比较 大 时 
像 域 格 点 化 (image-domain gridder, 
项 投影 和 A 项 投影 ， 且 计算 成 本 较 低 。 这 
eM, Van der Tol 等 人 ”开发 了 通过 AW 
HUGE 


依赖 


了 格 点 化 在 探 涡 


I 宇宙 再 
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高 动 


4 面向 宇宙 再 电离 探测 的 基本 数据 处 理 流程 


本 章 主要 对 SKA IRA 
处 理 流 程 进行 介 


表 四 所 示 。 


LOFAR 


的 成 像 ; 


(6) 射 


2H, 


aE 


线 增益 校准 、 杯 


日 位 校准 、 


x} MWA, LOFAR 和 GMRT Æ% 


本 的 数据 处 理 流程 如 下 : 
视 场 外 亮 源 剔 除 等 ; 


电源 搜索 及 天 空 


模型 建立 


(1) 数据 检查 ; 


(PyBDSF, LSMToo1). 


ta THz, w MWA, LOFAR 等 阵列 的 面 


(4) 基于 SAGECAL 的 校准 ; 


在 


f 究 相似 ， 


在 进 


普 测 | 


量 中 的 时 


行 格 点 化 的 结果 更 为 理 
行 图 像 处 理 
当然 权重 以 及 robust 权重 ， 从 而 在 


态 范围 成 像 、 大 视 场 成 像 等 


向 再 电离 探测 数据 
处 理 中 常用 的 软件 进行 了 总 结 ， 如 


(2) 干扰 剔除 (AOFlagger); 
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表 1 ”各 个 干涉 阵列 数据 处 理 使 用 的 方法 或 软件 

阵列 RFI 去 除 校准 成 像 天 空 模型 

MWA AOFlagger ” RTS, FHD™ WSClean"" Aegean" 
LOFAR AOFlagger Sagecal-C0 WSClean buildsky  " 

GMRT SVD, FLAGCAL!  SPAM(AIPS)"""  SPAM(AIPS) PyBDSM 

ik: 表格 列举 的 是 各 阵列 进行 再 电离 探测 功率 谱 探测 时 使 用 的 方法 或 软件 ， 也 是 各 阵列 目前 使 用 的 比 
较 常 见 的 工具 ， 在 具体 的 数据 处 理 中 ， 根 据 观测 科学 目标 ， 数 据 情况 等 ， 有 些 研究 者 可 能 会 选择 采用 其 
他 的 方法 或 软件 进行 数据 处 理 。 


观测 和 数据 情况 以 及 科学 目标 进行 调整 。 如 图 四 展示 的 是 LOFAR 测量 EoR 功率 谱 上 限 的 


时 候 使 用 的 数据 处 理 流程 ， 


的 标记 ， 以 及 频率 方向 上 的 平均 。 然 后 使 用 


观测 数据 首先 进入 预 处 理 流程 ， 包 


含 使 用 AOFlagger 进行 RFI 
Sagecal 通过 北 天 极 包含 28755 个 定 标 源 的 天 


空 模型 进行 校准 。 校 准时 可 分 为 两 部 分 ， 方 向 无 关 的 校准 (DI) 和 方向 相关 的 校准 (DD). 77 


向 无 关 的 校准 主要 不 考虑 方向 依赖 ， 在 较 大 的 天 区 内 对 增益 、 


相位 等 进行 大 致 校准 ， 方 向 


相关 的 校准 则 是 将 数据 按照 天 区 进行 更 加 精 绢 


的 划分 ， 


每 个 小 天 区 ， 分 别 进行 增益 、 


如 图 T2 将 观测 天 区 分 成 122 份 ， 对 
相位 等 校准 。MWA 中 这 两 部 分 的 校准 都 可 以 在 RTS 中 进行 ， 


对 于 GMRT 则 包含 在 SPAM 处 理 管线 中 。 使 用 WSClean 对 校准 过 的 数据 进行 成 像 后 ， 便 
将 测量 值 转化 为 亮 温度 表示 ， 然 后 使 用 高 斯 过 程 回 归 进 行 前 景 去 除 ”， 最 后 进行 功率 谱 的 


测量 。 


预 处 理 (DPPP) 


RFI 标 记 (AOFlagger) 


2 s, 61 kHz 数据 平均 


DI 校准 (Sagecal-CO) 


观测 
频率 范围 : 134.1~147.1 MHz 
TIX: 2s, 3.1 kHz 


逆 误 差 加 权 


RAR: DARA, P es i 
FEL 416 成 分 ( 视 流量 >35 mJy) 见 文献 [50] 章 节 3.3 的 表 3 
解 积分 ; 10 s, 1 SB Eon ro 


基线 >50X 


DD 校准 (Sagecal-CO) 
天 空 模型 : 分 为 122 组 ， 
共 28 773 成 分 
解 积 分 : 2.5~20 min, 1 SB 


基线 >250X 


图 12 


18 shapelets 组 分 
包含 Cygnus A 和 
Cassiopeia A 


成 像 (WSClean) 


1 SB 成 一 张 图 

基线 : 50~250 和 
图 像 分 辩 率 : 30 角 秒 
大 小 : 1500X1500 像 素 


不 同日 期 观测 平均 
道 误差 加 权 


在 垂直 视线 方向 上 ， 使 用 
4 的 Turkey 渐 变 窗口 


,标记 : 标记 UV 和 频率 空 | 
中 的 异常 值 


LOFAR 高 频段 天 线 (120 ~ 240 MHZ) EoR 功率 谱 测量 数据 处 理 流程 图 加 
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MWA 进行 EoR 功率 谱 测 量 的 管线 主要 包括 : 实时 系统 (real time system, RTS) 
/宇宙 学 HI 功率 谱 测 量 管线 (cosmological HI power spectrum estimator, CHIPS") 以 及 
FHD/eppsilon 管线 ， 其 中 RTS 和 FHD 主要 用 于 校准 和 成 像 ，CHIPS 和 eppsilon 用 于 功 
率 谱 的 测量 。RTS 包含 了 可 视 度 积 分 、 循 环 校 准 以 及 成 像 三 个 主要 部 分 ， 其 中 循环 校准 部 
分 能 够 利用 全 频率 的 方向 相关 的 波束 响应 、 电 离 层 的 建 模 与 校正 、 使 用 包含 点 源 和 延展 源 的 
天 空 模型 进行 校准 和 源 剥 离 等 手段 ， 实 现 对 MWA 数据 进行 高 程度 的 校准 。RTS 更 为 详细 
的 流程 可 以 参考 文献 图 中 的 图 10。FHD 是 MWA 的 另 一 套 可 以 对 测量 的 可 视 度 数据 生成 
校准 过 后 天 空 图 像 的 管线 。 它 最 初 是 设计 用 来 进行 高 效率 反 卷 积 的 程序 ， 它 利用 全 息 映 射 函 
数 ， 在 无 精度 损失 的 情况 下 ， 提 高 全 息 反 卷 积 的 速度 ; 但 是 现在 已 经 成 为 EoR 功率 谱 分 析 
中 进行 校准 和 成 像 的 重要 一 步 。 它 包含 三 个 核心 功能 : (1) 生成 天 空 模型 的 可 视 度 数据 ， 用 
以 校准 和 前 景 扣除 ; (2) 对 校准 过 后 的 数据 进行 格 点 化 ; (3) 进行 成 像 。 

而 功率 谱 测 量 管线 中 ，CHIPS 是 不 需要 对 数据 进行 成 像 ， 可 以 直接 从 校准 过 后 的 可 视 
度数 据 中 测量 功率 谱 及 误差 的 管线 。 它 采用 最 大 似 然 估 计 ， 在 充分 考虑 仪器 和 前 景 残留 对 于 
测量 数据 的 协 方差 的 影响 情况 下 ， 最 大 程度 提取 宇宙 学 信息 。eppsilon 则 是 从 三 维 图 像 数据 
上 直接 测量 功率 谱 ， 它 能 够 在 积分 图 像 上 计算 数据 、 模 型 、 残 差 的 功率 ， 进 行 观测 噪声 的 测 
量 ， 测 量 误差 的 估计 等 ， 帮 助人 们 获得 可 靠 的 功率 谱 上 限 。Barry 等 人 ”在 使 用 MWA 观测 
数据 测量 EoR 功率 谱 时 ， 比 较 了 来 自 RTS/CHIPS 管线 和 FHD/eppsilon 管线 的 结果 ， 两 
条 管线 给 出 的 功率 谱 上 限 具 有 较 好 的 一 致 性 ，A: 随 模具 有 一 致 的 变化 ，RTS/CHIPS 管 
线 能 够 恢复 出 更 多 的 天 模 ， 而 FHD/eppsilon 管线 则 在 小 大 模 处 具有 更 低 的 功率 谱 上 限 。 总 
fk EX, MWA 的 数据 处 理 流 程 与 LOFAR 相似 ， 包 含 相似 的 流程 ， 也 使 用 AOFlagger, 
WSClean 等 进行 射电 干扰 的 去 除 和 成 像 。 在 进行 巡天 数据 的 大 视 场 成 像 时 ， 会 对 经 过 校准 以 
及 WSClean 后 的 图 像 进行 马赛 克 图 像 拼 接 。 

GMRT 的 RFI 识别 主要 使 用 单 值 分 解 方 法 (singular value decomposition, SVD) 和 
FLAGCAL 包 (在 区 3 节 中 有 介绍 )，SVD 方法 主要 用 于 宽带 干扰 的 吻 除 。SVD 剔除 干扰 ， 是 
指 利用 单 值 分 解 的 方法 将 数据 分 解 为 不 同 的 模 ， 因 为 干扰 与 信号 特征 的 不 同 ， 会 对 应 在 不 同 
的 模 上 ， 将 干扰 对 应 的 模 扣 去 ， 从 而 剔除 干扰 。 这 种 方法 也 可 以 应 用 于 平滑 前 景 的 扣除 ， 如 
FASTICA 就 是 基于 这 种 方法 。 
T. GMRT 也 有 一 条 功能 比较 齐全 的 数据 处 理 管线 一 一 源 剥 离 与 大 气 建 模 (Source Peeling 
= and Atmospheric Modeling, SPAM™ ™) 管线 ， 它 是 基于 AIPS 的 Python 模块 ， 主 要 包含 

预 处 理 和 主 处 理 两 部 分 。 其 中 预 处 理 ， 输 入 LAT 格式 的 可 视 度 数据 ， 以 及 记录 望远镜 观测 
情况 的 FLAG 文件 ， 使 用 流量 定 标 源 进行 增益 和 带宽 校准 ， 进 行 初步 的 RFI 标记 ， 然 后 将 
初步 校准 的 可 视 度数 据 拆 分 为 不 同 TOSS 观测 指向 的 数据 ， 输 入 到 主 处 理 流程 。 主 处 理 流 
程 包含 精细 的 RFI 标记 、 方 向 无 关 的 校准 、 方 向 相关 的 校准 、 电 离 层 色散 效应 的 建 模 与 改 
正 、 宽 场 成 像 、 星 表 的 提取 等 ， 将 预 处 理 输入 的 数据 转化 为 最 终 观测 图 像 。 更 加 详细 的 处 理 
流程 可 以 参考 文献 uS) 的 图 A.1, A.2, A.3。 由 于 前 面 提 到 过 的 ， 诸 如 RFI、 仪 器 效应 、 电 
离 层 改正 、 完 善 天 空 模型 等 原因 ， 目 前 这 些 EoR 数据 处 理 方法 能 达到 的 功率 谱 上 限 依然 高 
于 理论 预计 的 EoR 信和 号 功率 。 
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随 着 射电 望远镜 阵列 的 建设 ， 射 电 数 据 处 理 方 法 的 改进 成 为 实现 科学 目标 的 重要 前 提 。 
本 工作 对 面向 宇宙 再 电离 探测 的 低频 射电 干涉 阵列 数据 处 理 的 基本 方法 进行 了 概述 。 由 于 
篇 幅 的 限制 ， 并 没有 涉及 到 所 有 的 细节 问题 。 而 且 针 对 不 同 科学 目标 的 观测 需求 ， 数 据 处 
里 的 技术 也 会 有 很 大 差异 ， 需 要 针对 不 同 的 科学 目标 选择 数据 处 理 的 方案 以 及 开发 新 的 算 
法 。 如 CASA, MIRIAD, AIPS 等 面向 射电 干涉 阵列 数据 处 理 的 软件 包 可 以 满足 基本 的 数据 处 
里 需求 ， 但 随 着 对 高 动态 高 精度 成 像 、 海 量 高 效 的 数据 处 理 、 高 精度 校准 等 要 求 的 提高 ， 这 
些 软件 包 都 具有 局 限 性 。 基 于 目前 已 经 在 运行 中 的 射电 干涉 阵列 21CMA, LOFAR, MWA, 
GMRT 等 ， 数 据 处 理 的 技术 和 方法 在 不 断 地 发 展 中 。 尤 其 在 面向 未 来 SKA 大 型 射电 望 远 
镜 阵列 的 海量 数据 处 理 时 ， 如 何 兼顾 精度 与 效率 ， 对 数据 处 理 的 各 个 环节 都 提出 了 更 高 的 
要 求 。 
数据 校准 是 射电 干涉 阵列 数据 处 理 中 最 大 的 难点 之 一 。 如 果 对 原始 的 非 格 点 化 的 可 视 
度数 据 进行 校准 ， 那 么 将 造成 计算 资源 的 巨大 消耗 ， 同 时 为 了 获取 更 为 理想 的 校准 结果 ， 还 
要 兼顾 时 间 和 频率 分 辩 率 ， 在 计算 、 存 储 方面 都 是 巨大 的 挑战 。 然 而 数据 校准 却 是 实现 某 些 
科学 目标 ， 如 宇宙 再 电离 探测 的 统计 测量 ， 无 法 避免 的 数据 处 理 需 求 。 针 对 未 来 SKA 阵列 
的 海量 数据 处 理 需求 ， 将 采用 区 域 中 心 的 建设 方案 ， 实 现 原始 观测 数据 到 科学 用 户 的 对 接 ， 
将 在 区 域 中 心 上 搭 建 统一 的 前 期 数据 处 理 平 台 ， 绥 解数 据 分 发 到 科学 用 户 过 程 中 的 压力 。 
除了 本 工作 讨论 的 干扰 识别 与 去 除 、 数据 校准 成 像 等 基本 的 数据 处 理 步骤 ， 针 对 不 同 
低频 射电 阵列 以 及 观测 模式 ， 还 会 涉及 到 如 多 波束 成 像 、 巡 天 观测 模式 时 的 马赛 元 图 像 拼 
BOR. 另外 ， 本 工作 的 讨论 主要 集中 在 软件 方面 。 在 面向 未 来 大 型 射电 阵列 的 数据 处 理 中 ， 
还 要 结合 软件 和 硬件 的 使 用 来 获得 理想 的 数据 处 理 结果 ， 如 在 计算 过 程 中 合理 使 用 现场 可 
编程 逻辑 门 阵列 (field programmable gate array, FPGA)、 图 形 处 理 器 (graphics processing 
unit, GPU) 等 。 
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Abstract: Data processing plays a crucial role in achieving the scientific objectives based on 
radio interferometers. Detection of the Epoch of Reionization (EoR) is one of the key science 
projects for current low frequency radio interferometers and the coming Square Kilometre 
Array (SKA). There are still many difficulties and challenges in data processing of radio 
interferometers. With the construction of SKA, higher sensitivity, resolution and massive 
amount of data pose new challenges for data processing in both softwares and hardwares. 
High precision calibration, wide field and high dynamic imaging are required in the EoR 
detections. This work summarizes the basic data processing methods of low-frequency radio 
interferometers, such as radio frequency interference identification and removal, calibration, 
studies on visibilities and images, etc. This work also introduces some common techniques 
and softwares used by current SKA Pathfinders, such as MWA, 21CMA, LOFAR, GMRT 
and the EoR power spectra estimate pipeline used in SKA Pathfinders. 
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